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摘要 : 注意 瞬 脱 (Attentional Blink, AB) 是 指 面 对 接连 不 断 出 现 的 刺激 时 个 体会 表现 出 对 较 短 
时 间 内 的 刺激 识别 能 力 减 弱 的 现象 。 注意 瞬 脱 的 出 现 很 容易 造成 个 体 对 后 续 信 息 加 工 的 流失 ， 是 
注意 在 时 间 维 度 上 局 限 性 的 体现 。 而 大 量 研究 指出 ， 个 体 在 与 复杂 信息 环境 进行 交换 沟通 时 ， 对 
于 可 以 在 视觉 和 听觉 通道 同时 呈现 信息 的 物体 或 刺激 识别 更 快 更 精准 。 现 有 研究 表明 ， 视 听 整 合 
不 仅 可 以 促进 空间 注意 的 定向 和 搜索 效率 ， 同 样 在 长 时 程 注 意 中 也 会 引起 感觉 促进 效应 。 本 研究 
探讨 视听 整合 是 否 可 以 调节 注意 瞬 脱 造成 的 局 限 性 影响 ， 如 果 存 在 影响 ， 那 么 整合 的 强度 又 会 
如 何 影响 注意 瞬 脱 ， 并 且 这 种 调节 的 效能 如 何 更 优化 。 实 验 1 中 启用 RSVP 范式 ， 通 过 对 比 不 同 声 
音 条 件 下 的 瞬 脱 效应 探究 视听 整合 对 注意 瞬 脱 的 影响 ， 结 果 发 现 当 被 忽略 的 声音 与 瞬 脱 窗口 的 
— 目标 同步 出 现时 识别 正确 率 明显 提高 ， 证 明了 视听 整合 可 以 减 小 注意 瞬 脱 ， 且 这 种 影响 并 不 是 
K 由 于 听觉 凸显 导致 的 。 实 验 2 根据 偏向 竞争 模型 ， 通 过 增加 听觉 任务 将 注意 分 配 到 视听 双 通 道中 
ev) 探究 不 同 整合 程度 对 瞬 脱 的 调节 作用 ， 结 果 发 现 当 需要 注意 的 声音 与 瞬 脱 窗口 的 目标 同步 出 现 
时 识别 正确 率 更 显著 提升 ， 证 明了 视听 整合 效应 增强 可 以 更 显著 地 减 小 注意 瞬 脱 。 与 此 同时 也 说 
明了 视听 整合 可 以 不 同 程度 地 调节 影响 注意 瞬 脱 现象 。 
关键 词 : 注意 瞬 脱 ， 多 感觉 整合 ， 视 听 整 合 ， 通 道 选 择 性 注意 ， 双 通道 分 配 性 注意 
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在 注意 持续 性 加 工 过 程 中 ， 面 对 接连 不 断 出 现 的 刺激 时 个 体会 对 较 短 时 间 内 的 
刺激 识别 能 力 减 弱 ， 这 种 时 程 加 工 有 限 的 现象 被 Raymond 等 人 (1992) 命 名 为 注意 瞬 
脱 现象 [Attentional blink, 简称 AB)， 即 当 于 同一 位 置 接连 出 现 不 同类 型 的 刺激 时 ， 如 
果 第 二 个 目标 (Target2, 简称 T2) 出 现 于 第 一 个 目标 (Targetl, 简称 TH) 之 后 很 短 的 时 间 
间隔 窗 内 (Target onset asynchrony, 简称 TOA)， 这 个 时 间 窗 约 200-500ms, 那么 被 试 对 
于 T2 识别 的 正确 率 会 显著 降低 (Barry et al., 2015; Broadbent & Broadbent, 1987; Chun 
& Potter, 1995; Dux & Marois, 2009; Pomerleau et al., 2014; Raymond, Shapiro, & Arnell, 
1992; Shapiro, Raymond, & Arnell, 1997; Weichselgarner, 1987; MRA, 王 苏 妍 , 2012), 1% 
By IS} [AY faa EAE 44 AYE es BB eet PRB, 刘 爱 书 , 2015; 陈 江涛 等 人 , 2014)。 总 结 而 
言 ， 注 意 瞬 脱 现象 可 以 理解 为 一 种 注意 在 较 短 时 间 进 程 中 出 现 的 功能 性 盲 现 象 
(Martens & Wyble, 2010; 张 明 , 王 凌 云 , 2009)， 它 反映 了 注意 在 时 间 动 态 维度 层面 上 
一 种 基本 的 认 知 局 限 (lsaak, Shapiro, & Martin, 1999; Potter, Staub, & Connor, 2002), 
即 在 一 定时 间 内 个 体 的 知觉 系统 可 以 连续 加 工 的 信息 数量 是 有 限度 的 (Marois & 
Ivanoff, 2005)， 并 且 它 是 一 种 可 以 用 于 衡量 注意 资源 在 刺激 时 间 序 列 分 配 的 特征 现 
RRE, 高 湘 萍 , 2013)。 

研究 学 者 通常 采用 连续 快速 序列 呈现 (Rapid Serial Visual Presentation, 简称 
RSVP) 的 研究 范式 来 对 注意 的 时 间 特 性 一 一 注意 瞬 脱 效应 进行 考察 (Chen & Wang, 
2012; Dux & Marois, 2009; Russo, Kates, & Wyble, 2017; Œ, 2017)， 该 方法 起 初 由 
Lawrence 等 人 (1971) 率 先 应 用 于 人 脑 对 连 串 刺激 处 理 能 力 的 研究 当中 ， 随 后 大 量 应 
用 于 该 领域 的 类 似 研究 ，Jane E. Raymond 等 人 (1992) 在 前 人 研究 的 基础 之 上 发 展 并 
衍生 出 了 该 实验 范式 。 经 典 的 注意 瞬 脱 实验 流程 首先 要 求 被 试 注视 屏幕 中 心 的 中 央 注 
视点 ， 随 后 在 屏幕 中 心 会 以 每 秒 钟 10 个 刺激 的 速度 匀速 逐一 呈现 包含 两 个 英文 字母 
在 内 的 单个 阿拉 伯 数 字 刺 激流 ， 被 试 需要 按 顺 序 依 次 识别 数字 ( 非 目标 刺激 ) 刺 激流 
中 的 两 个 字母 (目标 刺激 ,依次 记 为 T1 和 T2)。 行 为 学 结果 主要 考察 被 试 在 以 第 一 个 目 
标 判 断 正 确 为 前 提 下 再 判断 第 二 个 目标 是 否 正确 的 概率 ， 记 为 T2/T1。 并 将 T2 相对 
F T1 的 接近 程度 被 称 为 滞后 (简称 Lag)，Lag 可 以 表示 为 T2 在 T1 之 后 的 相对 位 置 
(MacLean & Arnell, 2012)。 实 验 结 果 发 现 ， 被 试 对 T2 的 识别 准确 性 随 着 Lag 的 增 大 
出 现 了 先 降 低 后 上 升 至 稳定 的 数据 变化 ， 而 对 于 Tl 之 后 200-500ms 的 时 间 窗 内 T2 
识别 正确 率 出 现 显著 下 降 。 

研究 发 现 注 意 瞬 脱 现象 的 程度 在 不 同 实验 中 并 不 是 一 成 不 变 的 ， 可 以 通过 调节 
某 些 影响 因素 进而 增强 、 削 弱 瞬 脱 的 程度 甚至 是 摆脱 瞬 脱 现象 。 多 种 因素 都 会 影响 瞬 
脱 现象 ， 在 实证 研究 中 它 不 仅 会 受到 被 试 当下 特征 属性 的 影响 ， 同 样 也 会 受到 实验 
设置 的 影响 。Cindy 等 人 (2001) 将 经 典 注 意 瞬 脱 研究 范式 应 用 到 不 同年 龄 阶段 的 群体 
中 ， 结 果 表 明成 年 后 随 着 年 龄 的 增长 和 感知 觉 的 不 敏感 ， 老 年 人 会 表现 出 更 明显 的 
注意 瞬 脱 (Van et al., 2009)。 在 特殊 人 群 的 研究 中 ， 王 庭 照 等 人 (2019) 发 现 玲 人 相 较 于 
听力 正常 的 人 在 同等 条 件 下 会 表现 出 更 显著 的 注意 瞬 脱 效应 ，Amirault 等 人 (2009) 在 
对 自 闭 症 患 者 中 的 研究 中 也 发 现 他 们 较 正常 人 更 容易 产生 注意 瞬 脱 ， 并 且 像 精神 分 
裂 症 患者 (Mathis et al., 2012)、 注意 缺陷 多 动 症 患 者 ( 程 浩 , 刘 爱 书 , 2017 )、 阅读 障碍 患 
者 ( 汪 静 , 2019) 以 及 抑郁 症 患 者 (李宁 , EWE, 高 旭光 , 2006) 等 一 些 患 有 执行 功能 障碍 、 
注意 力 缺 陷 和 出 现 相 关联 器 质 性 病变 的 群体 也 都 会 在 注意 的 时 间 持 和 久 度 层 面 表现 出 
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较 大 的 损害 ( 陈 江涛 等 人 , 2014)。 更 有 研究 学 者 在 实验 中 发 现在 人 群 中 存在 5% 左 右 的 
群体 ， 他 们 的 瞬 脱 程度 很 小 甚至 不 会 出 现 该 类 现象 并 将 他 们 称 为 无 注意 瞬 脱 者 (non- 
blinker)(Martens & Johnson, 2005; Martens, Munneke, Smid & Johnson, 2006)。 个 体 之 间 
差异 也 是 影响 注意 瞬 脱 的 重要 原因 ， 大 脑 工 作 记 忆 容 量 与 此 也 密切 相关 
(Nieuwenstein & Potter, 2006)， 有 具体 表现 为 工作 记忆 容量 越 大 越 不 容易 导致 注意 瞬 脱 
(Colzato, Spape, Pannebakker & Hommel, 2008)， 然 而 当 记 忆 负 和 荷 严重 时 注意 瞬 脱 就 
会 表现 的 愈 发 明显 (Akyurek, Hommel & Jolicoeur, 2007; Akyurek, Leszczynski & Anna, 
2010)。 不 仅 如 此 ， 许 多 研究 也 指出 个 体 当 前 情绪 状态 的 影响 也 不 可 小 遍 ， 当 持续 性 
注意 过 程 中 资源 产生 竞争 时 积极 情绪 更 容易 引起 注意 从 而 减 小 注意 瞬 脱 (Olivers & 
Nieuwenhuis, 2005; Vermeulen, 2010) 而 负 性 情绪 则 容易 诱发 更 大 的 注意 瞬 脱 效应 
(MacLean, Arnell & Busseri, 2010; Smith, Most, Newsome & Zald, 2006)。 也 有 研究 表明 
处 于 高 焦虑 状态 的 个 体 也 会 表现 出 更 明显 的 注意 瞬 脱 现象 (Van Dam, Earleywine & 
Altarriba, 2012)。 

除了 被 试 当 前 的 状态 属性 ， 在 研究 过 程 中 实验 任务 的 设计 和 刺激 材料 的 呈现 与 

设置 也 会 明显 影响 个 体 表现 出 的 瞬 脱 效应 大 小 。Arnell 和 Jolicoeur(1999) 在 相同 的 实 
验 环 境 中 通过 操控 相 邻 刺激 之 间 的 时 间 间 隔 (Stimulus Onset Asynchrony, 简称 SOA) 
现 ， 拉 长 SOA 的 同时 由 于 干扰 性 减弱 会 导致 注意 瞬 脱 现象 缓解 。 在 前 人 研究 基础 之 
上 归纳 不 难得 出 控制 SOA 和 单个 刺激 呈现 时 间 都 可 以 影响 注意 瞬 脱 的 结论 。 对 刺激 
呈现 时 程 的 规律 进行 总 结 后 可 以 得 出 : 在 瞬 脱 产生 的 时 间 窗 口内 ， 保 持 SOA 固定 不 
变 时 注意 瞬 脱 效应 随 着 刺激 呈现 时 间 延 长 而 减 小 ， 而 保持 呈现 时 长 固定 不 变 时 注意 
瞬 脱 效应 会 随 SOA 的 增加 而 减 小 。 除 此 之 外 也 有 研究 指出 在 刺激 材料 的 选取 过 程 中 ， 
目标 刺激 与 其 前 后 呈现 的 分 心 干扰 物 的 属性 差异 也 会 形成 不 同 程度 的 瞬 脱 现象 
(Maki, Bussard, Lopez, & Digby, 2003); 而 当 两 者 同属 一 类 时 ， 刺 激 的 语义 概念 也 会 
影响 注意 瞬 脱 的 大 小 (Dux & Coltheart, 2005)。 王 凌云 (2008) 归 纳 得 出 ， 分 心 干 扰 物 与 
目标 刺激 相似 之 处 越 多 越 容 易 使 得 个 体 产 生 注意 瞬 脱 现象 ,就 处 于 瞬 脱 窗口 的 目标 刺 
激 的 属性 而 言 ，Choi 和 Chang 等 人 (2012) 在 传统 研究 范式 之 上 进行 修改 ， 将 T2 的 颜 
色 进 行 突出 标识 后 发 现 ， 后 续 目 标 在 颜色 属性 的 突出 标识 可 以 减弱 注意 瞬 脱 现象 。 随 
后 Luo 和 Zhao(2014) 在 RSVP 范式 中 通过 操控 两 目标 之 间 颜 色 属 性 的 一 致 性 和 类 别 
属性 的 一 致 性 发 现 ， 颜 色 属 性 和 类 别 属 性 都 会 对 注意 瞬 脱 产生 影响 。 不 仅 如 此 ， 增 加 
T2 刺激 相同 物理 属性 的 强度 也 同样 可 以 影响 注意 瞬 脱 效应 (Joo & Chong, 2013; 
Landau & Bentin, 2008)。 然 而 目标 属性 的 改变 不 仅仅 局 限于 在 物理 水 平 层面 ， 也 可 以 
扩展 到 更 具有 生态 学 意义 的 通道 属性 进行 探究 ，Oliver 和 Van der Burg (2008) 发 现 当 
T2 从 视听 通道 同时 呈现 时 也 会 减 小 注意 瞬 脱 效应 (Kranczioch & Thorne, 2015; 
Schneider, 2013)。 类 似 的 发 现 也 存在 于 其 他 感觉 层面 ，Robinson，Mattingley 和 Judith 
(2013) 操 控 目 标 在 视觉 和 嗅觉 通道 上 的 属性 ， 结 果 发 现 个体 对 视 嗅 两 通道 同时 呈现 
的 目标 识别 能 力 提 高 ， 表 明 目 标的 通道 属性 同样 可 以 影响 注意 瞬 脱 现象 , 韩 僵 僵 和 赵 
俊 华 (2013) 总 结 指出 : Æ RSVP 范式 中 与 任务 无 关 的 某 些 属性 凸显 的 目标 刺激 会 大 量 
捕获 注意 并 通过 数据 驱动 加 工 引 起 注意 在 时 间 维 度 上 的 起 伏 。 

当 个 体 与 外 界 环境 进行 信息 交换 时 ， 人 脑 会 对 可 以 从 多 个 感觉 通道 同时 输入 的 
信息 感知 更 为 敏锐 (Chen, Pan, & Wang et al., 2016; Ernst & Biilthoff 2004; Frassinetti et 
al., 2002; Frens et al., 1995)， 并 且 个 体 为 了 能 够 更 加 准确 地 完成 在 复杂 环境 中 的 信息 
搜索 任务 ， 可 以 将 来 自 不 同感 觉 通 道 的 信息 汇集 成 一 个 连贯 整体 且 有 意义 的 表征 


(Koelewijn, Bronkhorst, & Theeuwes, 2010)， 这 种 用 于 处 理 不 同感 官 系统 之 间 信 息 的 
脑 功能 被 称 为 多 感觉 整合 (Multisensory Integration, 简称 MSI, Beauchamp et al., 2004; 
Lewkowicz & Ghazanfar, 2009; Talsma et al., 2010)， 即 将 来 自 不 同感 觉 通 道 的 信息 相 
互 作用 并 整合 为 统一 的 、 连 贯 的 、 稳 定 的 和 有 意义 的 知觉 过 程 (Ernst & Bilthoff, 2004; 
Jong et al., 2009; Spence, 2007; Stein & Stanford, 2008; Tang, Wu, & Shen, 2016; 文 小 辉 
等 , 2009)。 多 感觉 整合 可 以 通过 拟 合 来 自 各 个 通道 的 信息 以 减弱 知觉 系统 的 噪声 同时 
KE ER AU it HY BN BN (Lovelace, Stein, & Wallace, 2003)， 从 而 使 得 个 体 可 以 更 好 地 知觉 刺 
激 信 息 , 从 行为 上 表现 来 看 个 体会 对 同时 涵盖 多 通道 信息 的 判断 更 准确 更 快速 ( 孙 远 
路 等 人 , 2011)。 

Meredith、Nemitz 和 Stein(1987) 指 出 在 某 种 特定 条 件 下 会 出 现 多 种 感觉 抑制 效应 ， 
即 在 单个 或 两 个 位 置 监测 多 个 感觉 通道 信息 的 速度 要 慢 于 监控 单个 通道 中 信息 的 速 
度 (Santangelo, Fagioli, & Macaluso, 2010)。 然 而 目前 整合 领域 的 大 量 相关 研究 还 是 集 
中 于 对 促进 效应 进行 解释 和 深入 探讨 。 多 种 感觉 促进 效应 (Multisensory Performance 
Improvement Effects)， 有 具体 是 指 个 体 用 一 种 信息 源 蔡 换 多 种 通道 自 洽 的 信息 源 从 而 
减轻 了 因 处 理 元 余 信 息 导 致 的 认 知 负荷 现象 ， 它 对 多 感觉 通道 呈现 的 信息 加 工 有 促 
进 作 用 ， 如 和 元 余 信号 效应 (Redundant Signal Effect, 简称 RSM, Miller, 1982)。 对 该 效应 
的 解释 早期 存在 两 种 观点 相左 的 假设 模型 (Miller 1986)， 单 独 激活 模型 (也 称 竞争 模 
AY Race Model) 认 为 多 通道 信息 在 相互 分 离 的 通道 中 进行 加 工 ， 率 先 加 工 完成 的 通道 
会 优先 触发 进而 提高 反应 速度 (Raab, 1962)。 而 共同 激活 模型 (Co-activation Mode]) 则 
认为 源 于 多 个 通道 的 信息 会 在 某 个 特定 阶段 被 汇聚 加 工 并 融合 为 共通 的 知觉 信息 ， 
使 得 刺激 强度 增加 导致 反应 更 高 效 (Giray & Ulrich, 1993; Gondan et al., 2005; Miller, 
1982)。 然 而 现实 生活 中 由 于 接触 信息 的 复杂 性 和 不 确定 性 ， 人 脑 的 这 种 促进 现象 既 
有 可 能 存在 于 不 同 通道 间 的 信息 也 可 能 存在 于 相同 通道 内 的 不 同 信 息 间 (Knill & 
Saunders, 2003; Van der Kooij et al., 1999)， 所 以 很 难 去 程式 化 地 计算 最 佳 的 整合 模式 。 
后 期 就 有 研究 学 者 提出 了 贝 叶 斯 决策 模型 ， 它 可 以 更 优 的 诠释 整合 促进 效应 一 一 人 
脑 对 环境 刺激 的 感知 具有 目的 性 并 且 其 加 工 处 理 过 程 都 倾 癌 于 符合 利益 最 大 化 原则 
(Ermst & Bulthoff, 2004; Yuille & Bulthoff, 1993; 刘 强 , 张 志 杰 , 王 琪 , 张 庆 林 , 2008)。 然 
而 就 理论 延伸 到 现实 生活 的 可 行 性 而 言 ， 相 比 与 其 它 多 感觉 整合 形态 ， 宛 余 信 号 效 
应 这 种 知觉 促进 现象 受到 了 更 多 科研 人 员 的 关注 。 

在 日 常生 活 中 不 难 发 现 多 感觉 整合 影响 着 个 体 的 注意 指 癌 、 集 中 程度 和 唤醒 水 平 
等 ， 反 之 主动 地 控制 注意 也 同样 可 以 调节 这 种 多 种 感觉 整合 的 程度 。 无论 是 注意 还 是 
感觉 整合 都 有 助 于 控制 信息 的 高 效 处 理 ， 并 且 都 具有 多 阶段 性 和 复杂 性 ， 二 者 之 间 
的 交互 作用 机 制 也 同样 错综复杂 ( 绢 姓 , HA, FEES, 王 爱 君 , ERY, 2018). BK 
觉 整合 不 仅 对 注意 资源 有 提高 利用 作用 ， 同 样 违 背 原 则 的 自主 加 工 也 会 导致 不 利于 
个 体 注意 的 情况 发 生 。 从 多 感觉 错觉 层面 来 看 ， 以 几 种 最 为 常见 的 错觉 现象 为 例 。 
MuGurk 效应 是 人 类 言语 感知 中 的 一 种 常见 错觉 现象 ， 在 现实 生活 中 不 难 发 现 ， 现 
当 看 到 的 和 上 听 到 的 源 信息 存在 冲突 时 人 脑 对 视觉 信息 在 某 些 特定 条 件 下 会 干扰 个 体 
HI EREMI B IR, 康 冠 兰 , 周 晓 林 , 2018)， 导 致 个 体 注 意 无 法 集中 输入 。 腹 语 术 效 
应 则 是 一 种 视觉 主导 影响 听觉 检测 的 典型 例子 ， 受 这 种 错觉 现象 的 有 影响， 会 引起 个 
体 对 听觉 信息 源 的 注意 定 疝 产 生 偏差 (Kitagawa & Ichihara, 2002)。 而 双 次 闪光 错觉 则 
是 一 种 听觉 主导 视觉 的 整合 错觉 现象 ， 会 导致 注意 优先 加 工 听觉 信息 而 对 视觉 信息 
加 工 产生 偏差 ， 不 利于 个 体 对 视觉 信息 进行 准确 判断 (于 微 , 王 爱 君 , 张 明 , 2017)。 


虽然 多 感觉 整合 在 某 些 条 件 下 会 使 个 体 在 知觉 加 工 处 理 的 进程 中 产生 阻碍 性 的 
错觉 ， 但 是 多 数 情况 下 仍 对 注意 加 工 有 着 促进 作用 。 从 多 种 感觉 促进 现象 来 分 析 ， 以 
最 为 常见 的 视听 整合 促进 现象 为 例 。 视 听 整 合 能 够 通过 自 上 而 下 或 自 下 而 上 的 驱动 方 
式 对 注意 进行 捕获 提升 注意 的 定向 和 搜索 效率 (Tang, Wu, & Shen, 2016). Matusz 和 
Eimer(2011) 在 空间 线索 靶子 范式 中 操纵 线索 刺激 的 通道 属性 ， 结 果 发 现 视听 觉 线索 
可 以 捕获 更 多 注意 资源 进而 更 精准 地 帮助 个 体 对 后 续 目 标 进行 预测 提升 注意 的 定向 ， 
说 明 视 听 整 合 可 以 调节 并 影响 注意 的 定向 (Krause et al., 2012; Mahoney et al., 2012; 
Mast et al., 2015). Van der Burg 等 人 (2008) 在 视听 搜索 范式 的 实验 中 操控 目标 的 通道 
属性 ， 结 果 发 现 目标 刺激 伴随 与 任务 无 关 的 声音 刺激 可 以 显著 提升 搜索 速率 ， 说 明 
视听 整合 同样 可 以 影响 注意 的 搜索 效率 (Pluta et al., 2011; Van der Burg et al., 2011). 不 
单单 存在 于 选择 注意 领域 ， 视 听 整 合同 样 可 以 影响 持续 性 注意 。 有 研究 学 者 采用 经 典 
RSVP 范式 在 T2 出 现 的 时 候 同 步 呈 现 声音 刺激 ， 结 果 发 现 视 听觉 T2 对 传统 注意 瞬 
脱 现象 起 到 了 缓解 的 作用 (Olivers & Van der Burg, 2008)， 也 说 明了 视听 觉 整合 可 以 
促进 持续 注意 过 程 中 的 识别 效率 (Kranczioch & Thorne, 2013; Kranczioch & Thorne, 
2015)。 

多 感觉 整合 可 以 在 某 些 特定 的 条 件 下 对 个 体 的 注意 产生 影响 ， 同 样 大 量 研 究 也 
指出 注意 也 会 反作用 于 多 感觉 整合 (Talsma & Woldorff, 2005)。 主动 调控 注意 并 影响 多 
感觉 整合 效应 的 方式 大 致 可 以 分 为 两 种 ， 即 通过 注意 空间 指向 性 和 通道 选择 性 调节 
多 感觉 整合 的 促进 强度 (Tang, Wu, & Shen, 2016)。Spence(2001) 研 究 发 现 当主 动 分 配 
注意 在 空间 辨别 任务 中 时 ， 被 试 对 于 倾注 注意 的 位 置 上 的 视听 目标 判断 更 迅速 ， 表 
明基 于 空间 的 主动 注意 可 以 影响 多 感觉 整合 现象 (Fairhall & Macaluso, 2009; Li, Wu, 
& Touge, 2010); 而 当 注 意 集中 到 特定 的 通道 时 ， 对 该 通道 信息 的 知觉 也 增强 了 o 
Talsma, Doty 和 Woldorff (2007) 在 实验 中 发 现 当 被 试 将 注意 转向 视听 通道 时 对 视听 
刺激 的 反应 比 单独 注意 某 通 道 刺 激 下 检测 的 更 加 精准 ， 这 表明 了 控制 注意 通道 同样 
可 以 影响 多 感觉 整合 。Wilschut, Theeuwes 和 Olivers (2011) 随 后 也 归纳 指出 在 注意 的 
认 知 加 工 水 平 层 面 上 , 注意 系统 主要 由 定向 (空间 维度 ) 和 通道 选择 (通道 维度 ) 两 大 成 
分 构成 。 在 后 续 实践 研究 也 陆续 发 现 ， 注 意 不 仅 能 指向 空间 位 置 , 还 能 指向 某 种 感觉 
通道 (Talsma & Durk, 2015)。 基于 注意 的 通道 选择 性 ， 于 菩 等 人 (2017) 采 用 声音 诱发 内 
光 错 觉 范式 探究 不 同 注意 分 配方 式 对 声音 诱发 内 光 错 觉 的 影响 ， 研 究 结果 表明 注意 
指 癌 不 同 通 道 会 影响 整合 的 效应 进而 对 闪光 错觉 产生 影响 。Tang 等 人 (2019) 采 用 空间 
线索 靶子 范式 探究 注意 指向 不 同 通道 条 件 下 对 视听 目标 的 空间 定向 能 力 的 影响 ， 实 
验 结果 显示 ， 相 比 于 只 注意 视觉 通道 当 注意 双 通 道 时 视听 目标 产生 的 返回 抑制 量 降 
低 说 明 当 前 视听 整合 能 力 更 强 ， 也 表明 对 注意 的 通道 控制 可 以 调节 视听 整合 量 进 而 
影响 注意 现象 ( 顾 吉 有 , 2016; 唐 晓 雨 , IMER, wE, 2020)。 由 此 可 见 控 制 通道 注意 可 
以 调节 多 感觉 整合 进而 影响 注意 现象 已 经 在 注意 定向 和 辨别 层面 得 以 证 实 。 总 结 而 言 ， 
个 体 可 以 通过 主动 控制 注意 在 某 些 特定 的 条 件 下 反 过 来 影响 多 感觉 整合 的 效果 。 

先前 已 有 研究 证 实 了 视听 整合 可 以 促进 选择 性 注意 在 空间 维度 (注意 定向 ) 的 表 
现 (Krause et al., 2012; Mast et al., 2015; Matusz & Eimer, 2011)， 但 是 关于 视听 整合 对 
分 配 性 注意 在 时 间 维 度 ( 注 意 瞬 脱 ) 的 表现 的 探索 却 有 较 大 留 白 。 尽管 Oliver 和 Van der 
Burg (2008) 在 研究 中 己 对 两 者 进行 了 探究 ， 他 们 采用 RSVP 范式 通过 操控 声音 呈现 
位 置 ， 发 现 当 声音 与 视觉 目标 同步 呈现 可 以 减弱 注意 瞬 脱 的 发 生 并 把 这 种 现象 归结 
于 视听 增强 。 但 上 述 的 实验 研究 都 只 考虑 到 了 视听 目标 可 能 会 引起 感觉 整合 并 捕获 更 


多 的 注意 ， 而 忽略 了 刺激 的 凸显 性 同样 会 对 注意 捕获 的 起 到 促进 作用 。 有 关 研 究 指 出 
在 某 一 维度 足够 独特 显著 的 刺激 〈Singleton, 也 称 独子 ) 可 以 显著 捕获 个 体 的 注意 
(Becker & Horstmann, 2011; Theeuwes, 2013)， 并 且 这 种 捕获 现象 不 仅仅 存在 于 是 视 
觉 层面 的 物理 属性 ， 如 刺激 的 颜色 (Choi & Chang, 2012) 或 刺激 的 形状 (Luo & Zhao, 
2014)， 也 同样 会 存在 于 刺激 信息 的 通道 属性 。Vroomen 和 De Gelder(2000) 也 在 连续 
视觉 搜索 短 序列 中 添加 不 同 的 同步 声音 刺激 ， 发 现 当 听觉 通道 存在 新 异 凸 显 的 特征 
独子 时 ， 该 听觉 刺激 可 以 促进 对 短 序列 中 视觉 目标 的 识别 ， 说 明了 在 听觉 层面 凸显 
的 特征 独子 可 以 显著 地 捕获 注意 。 由 此 可 见 上 述 的 研究 探究 视听 整合 对 注意 瞬 脱 的 影 
响 研 究 并 没有 严格 地 控制 刺激 听觉 通道 属性 的 新 异性 ， 并 不 能 充分 地 说 明 同 步 的 声 
音 促进 视觉 搜索 是 视听 整合 增强 导致 。 那么 在 探索 视觉 注意 瞬 脱 的 研究 中 ， 与 瞬 脱 窗 
口内 T2 同步 的 听觉 刺激 捕获 注意 是 否 纯粹 是 由 于 视听 整合 引起 的 ? 如 果 可 以 排除 上 
述 因 素 说 明 瞬 脱 减 小 得 确 是 由 视听 整合 引起 的 ， 那 么 这 种 瞬 脱 减 小 的 现象 又 是 否 会 
受到 视听 整合 的 大 小 影响 呢 ? 因此 本 研究 通过 两 个 实验 来 探索 视听 整合 对 注意 瞬 脱 
的 影响 。 实 验 1 采用 传统 的 RSVP 范式 ， 在 此 基础 上 通过 操控 呈现 刺激 的 通道 属性 ， 
试图 在 排除 声音 凸显 性 因素 后 更 充分 地 考察 视听 整合 是 否 可 以 对 视觉 注意 瞬 脱 现象 
产生 有 影响， 并且 希望 在 本 实验 中 可 以 重复 出 前 人 在 相同 条 件 下 出 现 类 似 实验 现象 , 实 
验 2 则 在 实验 1 基础 之 上 通过 增加 听觉 通道 任务 ， 控 制 注 意 分 配 通道 ， 探 索 不 同 整 
合 强度 对 注意 瞬 脱 现象 的 影响 。 基 于 上 述 先前 研究 结果 ， 在 本 研究 能 够 观察 到 传统 的 
注意 瞬 脱 现象 ， 并 且 视 听 整 合 可 以 减 小 注意 瞬 脱 效应 ， 且 这 种 减缓 现象 与 声音 是 否 
凸显 无 关 。 与 此 同时 在 实验 2 中 ， 预 期 随 着 将 注意 分 配 到 双 通 道 会 引起 整合 能 力 增 强 ， 
视听 整合 对 注意 瞬 脱 的 减缓 作用 也 会 随 之 增强 。 
2 实验 1: 视 觉 集 中 注意 下 视听 整合 对 注意 瞬 脱 的 影响 
2.1 方法 

(1) 被 试 

根据 样本 量 和 统计 检验 力 采 用 计算 软件 G-Power3.1 计算 得 出 实验 一 所 需 被 试 为 
28 名 ， 本 实验 最 终 招募 的 被 试 均 为 ** 大 学 的 40 名 在 校本 科 生 或 研究 生 ， 其 年 龄 范围 
介 于 19~28 岁 之 间 ， 所 有 被 试 的 听力 和 视力 正常 或 者 矫正 后 的 视力 听力 正常 、 习 惯 
用 手 均 为 右 利 手 、 身 体 状 况 良 好 、 无 脑 部 损伤 和 精神 疾病 史 并 且 在 此 之 前 均 未 参加 过 
类 似 的 心理 学 实验 ， 实 验 完成 后 给 予 被 试 适量 的 报酬 。 由 于 本 实验 试图 探究 视觉 集中 
注意 下 下 视听 整合 对 注意 瞬 脱 的 影响 ， 故 将 其 中 4 名 无 注意 瞬 脱 现象 的 被 试 进行 剔 
除 后 进行 分 析 。 最 终 参 与 数据 分 析 的 有 效 被 试 人 数 为 36 人 (其 中 男生 18 名 ， 女 生 24 
名 )， 平 均 年 龄 为 20.83+2.01 岁 。 

(2) 实验 仪器 和 材料 

本 实验 中 的 所 有 视觉 刺激 均 呈 现在 Dell-E2316Hf 19 英寸 的 显示 器 上 ， 其 屏幕 的 
分 辩 率 为 1280x1024， 刷 新 率 为 60Hz， 实 验 的 过 程 中 要 求 被 试 的 双眼 距离 屏幕 中 央 
位 置 约 为 80cm。 实 验 中 所 有 的 视觉 刺激 均 呈 现在 灰色 背景 RGB:192,192,192) 屏 幕 上 ， 
本 实验 程序 的 编号、 呈现 和 数据 归纳 记录 在 E-primel.1 中 操作 并 完成 ， 并 运行 于 
Microsoft Windows7 的 系统 环境 中 。 实 验 材料 的 视觉 刺激 参考 Olivers 和 Van der Burg 
(2008) 的 实验 材料 均 呈 现在 屏幕 正中 央 ， 中 央 注 视点 (0.29°x0.29°)、 目 标 刺 激 和 干扰 
刺激 均 根 据 掩蔽 刺激 框 (0.86°*x0.86°) 线 条 采用 绘图 软件 Adobe Illustrator CC 2014 t 
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作 而 成 ， 听 觉 声音 材料 采用 声音 制作 软件 Adobe Audition 3.0 制作 而 成 ， 刺 激 为 
75dB 的 正弦 波 生 成 的 纯音 (1259HZ)， 持 续 时 间 50ms 与 视觉 刺激 同步 呈现 ， 声 音 通 
过 放置 在 显示 器 屏幕 后 中 央 的 外 置 扬声器 (PHILIPS SPA311) 播 放 ， 根 据 被 试 口头 报 
告 ， 能 够 明确 地 判断 出 该 声音 是 从 正中 央 的 位 置 发 出 。 

G) 实验 设计 和 实验 流程 

本 实验 采用 3( 声 音 条 件 : 无 声音 vs. 单 音 T2 vs. 全 程 伴随 )x3( 位 置 滞后 条 件 : 
Lag] vs.Lag2 vs.Lag5) 被 试 内 实验 设计 。 在 实验 过 程 中 条 件 总 共 为 9 种， 分 别 无 声音 
Lagl、 无 声音 Lag2、 无 声音 Lag5、 单 音 Lagl、 单 音 Lag2、 单 音 Lag5、 全 音 Lagl、 全 音 
Lag2 和 全 音 Lag$。 每 个 条 件 下 有 48 个 斌 次 ， 总 共 432 个 试 次 。 在 实验 的 过 程 当 中 通 
过 随机 化 的 区 组 设计 中 试 次 随机 呈现 ， 区 组 呈现 的 顺序 在 被 试 间 进行 平衡 ， 并 且 所 
有 的 条 件 都 进行 了 随机 化 。 

正式 实验 流程 如 图 1 所 示 ， 在 每 一 个 试 次 正式 开始 后 ， 首 先 会 在 屏幕 正中 央 呈 
现 一 个 1000ms 的 十 字 注 视点 ， 要 求 被 试 眼睛 盯 住 该 注视 点 ， 随 后 会 接连 快速 呈现 由 
23 个 元 素 组 成 的 刺激 流 ， 每 个 元 素 的 组 成 包括 四 个 屏 (刺激 呈现 67ms+ 空 白 屏 33ms+ 
掩蔽 刺激 50ms+ 空 白 屏 100ms)。 每 个 刺激 呈现 后 250ms 会 出 现下 一 个 刺激 ， 整 个 
RSVP 刺激 流 呈 现 之 后 屏幕 中 央 会 呈现 两 个 问题 (Q1: 你 看 到 的 第 一 个 字母 是 什么 ? 并 
在 键盘 输入 对 应 按键 ，Q2: 你 看 到 的 第 二 个 字母 是 什么 ? 并 在 键盘 输入 对 应 按键 )， 
要 求 被 试 对 屏幕 呈现 的 问题 作出 按键 反应 ， 此 过 程 不 要 求 快 速 反 应 ， 并 记录 被 试 的 
反应 正确 率 。 与 视觉 刺激 同步 的 声音 刺激 会 随机 呈现 ， 在 实验 过 程 当中 要 求 被 试 忽略 
声音 。 在 实验 开始 前 ， 被 试 坐 在 电脑 前 调整 下 巴 固定 器 和 升降 桌 使 目光 与 电脑 屏幕 中 
央 持 平 ， 实 验 开始 前 将 打印 好 的 统一 被 试 指 导语 发 放 给 被 试 浏览 ,进入 练习 阶段 ， 共 
有 36 次 包含 实验 的 每 一 种 水 平 条 件 (随机 呈现 )。 主 试 在 练习 阶段 中 陪同 被 试 完成 练习 
实验 ， 以 确保 被 试 可 以 清晰 了 解 并 正确 完成 实验 任务 。 整 个 实验 时 长 大 致 约 为 90 分 
钟 (包含 练习 和 休息 时 间 )。 
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图 1 实验 1 流程 图 


GE: 无 声音 条 件 下 ， 每 一 个 试 次 单纯 只 呈现 视觉 刺激 不 包含 听觉 刺激 ， 单 声 同 步 
条 件 下 ， 每 一 个 试 次 在 呈现 视觉 刺激 的 基础 上 当 第 二 个 目标 呈现 时 同步 一 个 听觉 刺 
激 ; 全 程 伴随 条 件 下 ， 每 一 个 试 次 在 呈现 每 个 视觉 刺激 时 都 同步 一 个 听觉 刺激 。) 

(4) 数据 分 析 

本 实验 采用 E-primel.1 和 Microsoft Office Excel 专业 增强 版 2016 软件 对 实验 数 
据 进 行 整理 和 分 析 ， 并 将 采用 IBM SPSS Statistics 21 和 JASP 0.11.1.0 软件 对 有 效 数 
据 进 行 统计 学 分 析 和 检验 。 

数据 分 析 有 两 个 因 变 量 : T1 正确 率 ( 判 断 第 一 个 目标 是 否 正确 的 概率 ) 和 T2/T1 
正确 率 ( 以 第 一 个 目标 判断 正确 为 前 提 再 判断 第 二 个 目标 是 否 正确 的 概率 )。 计 算 
T1 、T2/T1 正确 率 之 后 进行 进一步 分 析 。 首 先 以 TI1 为 因 变 量 进行 单 因 素 方 差分 析 ( 声 
音 条 件 : 无 声音 vs. 单 音 T2 同步 vs. 全 程 伴随 声音 分 析 声 音 条 件 主 效应 是 否 显 著 
并 比较 三 个 条 件 之 间 的 差异 显著 性 。 以 T2/T1 为 因 变 量 进行 3( 声 音 条 件 : 无 声音 vs. 
PE T2 同步 vs. 全 程 伴随 声音 )x3( 位 置 灌 后 条 件 : Lagl vs.Lag2 vs.Lag5) 两 因素 重复 
测量 方差 分 析 一 一 分 析 声 音 条 件 主 效应 和 位 置 条 件 主 效应 以 及 两 因素 之 间 的 交互 作 
用 是 否 显著 ， 并 随后 通过 简单 效应 分 析 比 较 不 同 声音 控制 条 件 之 间 的 差异 显著 性 。 根 
据 Martens 和 Wyble(2010) 指 出 的 衡量 AB( 不 同时 间 窗 之 间 正 确 率 差 异 ) 的 指标 ,对 不 
同 声音 条 件 下 产生 的 相应 AB 量 进 行 单 因素 方差 分 析 并 比较 差异 量 。 
2.2 结果 与 分 析 

Tl 总 体 正 确 率 为 88.64 %， 对 Tl 正确 率 进 行 单 因素 方差 分 析 ( 声 音 条 件 : 无 声 
音 vs. 单 音 T2 同步 vs. 全 程 伴随 声音 ) 方 差分 析 。 结 果 发 现 ， 声 音 的 效应 不 显著 FQ, 
105)=0.59, p=0.55, ns=0.01， 换 而 言 之 与 Tl 无关 的 声音 刺激 并 不 会 影响 被 试 对 第 
一 个 任务 的 判断 准确 率 。 

T2/T1 总 体 正确 率 为 88.29%， 对 T2/T1 正确 率 进 行 3( 声 音 条 件 : 无 声音 vs. 单 音 
T2 同步 vs. 全 程 伴随 声音 )x3( 位 置 滞后 条 件 : Laglvs.Lag2 vs.Lag$) 的 两 因素 重复 测 
量 方差 分 析 ( 见 图 2)。 结 果 发 现 : 声音 条 件 主 效应 显著 ，F2， 
70)=12.70，p<0.001，ns=0.27， 表 明 不 同 声音 条 件 下 会 影响 个 体 对 T2 判断 的 正确 
率 ( 即 注意 瞬 脱 现象 )， 并 通过 进一步 的 成 对 比较 发 现 一 一 无 声音 条 件 下 T2/T1 的 正确 
率 (85.35%) 显 著 小 于 单 音 T2 同步 条 件 下 T2/T1 的 正确 率 (90.539%0) 和 全 程 伴随 声音 条 
件 T2/T1 的 正确 率 (88.92%)， 说 明 当 与 T2 同时 呈现 一 个 声音 刺激 (相对 于 没有 声音 
时 被 试 对 T2 识别 的 正确 率 提 升 ， 注 意 瞬 脱 现象 得 到 了 缓解 。 

位 置 条 件 主 效应 显著 ，F(1.181, 41.350 )=40.73, p<0.001, 1,°=0.54, XH T2 到 
TL 不 同 的 滞后 位 置 条 件 会 影响 个 体 对 T2 判断 的 正确 率 ， 并 通过 进一步 的 成 对 比较 
发 现 一 一 Lag5 条 件 下 T2/T1 的 正确 率 (95.21%) 显 著 高 于 Lag2 条 件 下 T2/T1 的 正确 率 
(91.98%) 和 Lagl 条 件 下 T2/T1 的 正确 率 (77.67%)， 也 说 明了 在 本 实验 中 被 试 产生 了 
经 典 的 注意 瞬 脱 现象 一 一 在 RSVP 范式 中 对 T2 判断 的 正确 率 会 随 着 与 Tl 距离 的 增 
加 而 提高 。 
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图 2 实验 1 中 不 同 条 件 下 T2/T1 的 正确 率 和 标准 误 
QË: “ns” 表 示 p>0.05, “*» 表 示 p<0.05, “x*» 表 示 p<0.01) 


声音 和 位 置 交 互 作用 显著 ，F(2.812, 98.425)=23.98, p<0.001, 1, =0.41, 说 明 T2 
呈现 同步 的 声音 和 T2 滞后 T! 的 位 置 距离 两 因素 会 分 别 影响 被 试 对 T2 判断 的 正确 率 ， 
通过 进一步 简单 效应 分 析 结 果 发 现 ， 当 T2 位 置 处 于 Lagl 时 声音 的 效应 显著 ，F2， 
70)=29.89，p<0.001， ns=0.46， 具 体 表现 为 无 声音 条 件 下 T2/T1 的 正确 率 (68.37%) 
显著 小 于 另外 两 个 声音 条 件 下 的 正确 率 (82.84%、81.81%) 并 且 后 两 者 之 间 差 异 不 显著 
说 明 在 Lag] 条 件 下 当 声 音 同步 T2 出 现时 会 提升 个 体 对 其 判断 正确 率 并 且 与 这 种 现 
象 与 该 声音 是 否 凸 显 无 关 ; 当 T2 处 于 Lag2 时 声音 的 效应 不 显著 ， F, 
70)=1.36，pP=0.26，nn=0.04， 有 具体 表现 为 三 种 声音 条 件 下 T2/T1 的 正确 率 没 有 显著 
差异 ， 说 明 在 Lag 条 件 下 声音 条 件 对 T2 识别 正确 率 没 有 统计 学 上 的 显著 影响 ， 当 
T2 处 于 Lag5 时 声音 的 效应 显著 ，F(2, 70)=3.98，p=0.02，1 ,=0.09， 具 体 表 现 为 全 
程 伴随 声音 条 件 下 的 T2/T1 正确 率 (93.81%) 要 显著 低 于 无 声音 条 件 下 T2/T1 的 正确 率 
(96.24%)， 说 明 在 Lag5 条 件 下 非 凸 显 的 同步 T2 声音 刺激 会 干扰 被 试 对 T2 识别 的 正 
确 率 。 

最 后 以 瞬 脱 节点 前 后 时 间 窗 口 TI 和 T2/T1 正确 率 差 异 量 (衡量 AB 大 小 ) 为 因 变 
量 ， 不 同 声音 条 件 为 自 变 量 进行 单 因素 方差 分 析 ( 如 图 3) 。 结 果 发 现 ， 声 音 条 件 主 效 
应 显著 ，F(2, 105)=9.71，p<0.001，ns=0.16， 表 明 在 选择 性 注意 条 件 下 声音 的 不 同 
会 导致 个 体 注意 瞬 脱 产生 差异 ， 通 过 进一步 多 重 比 较 发 现 无 声音 条 件 引 起 的 AB 要 
显著 高 于 另外 两 个 声音 条 件 并 且 后 两 者 差异 不 显著 。 简 而 言 之 ， 说 明了 当 声 音 (不 论 
这 个 声音 是 否 凸显 ) 同 步 T2 出 现时 会 在 瞬 脱 窗口 内 减 小 个 体 的 注意 瞬 脱 现象 。 
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3 实验 2: 视 听 分 配 注意 下 视听 整合 对 注意 瞬 脱 的 影响 


根据 实验 1 的 结果 分 析 发 现 ， 视 觉 刺 激 和 与 任务 无 关 的 听觉 信息 两 者 引起 的 视 
听 整 合 的 确 是 影响 注意 瞬 脱 的 因素 ， 那 么 视听 整合 的 设置 和 调控 应 该 会 成 为 未 来 研 
究 注意 瞬 脱 局 限 性 研究 中 的 一 个 控制 因素 ， 这 样 能 有 效 地 提升 个 体 在 瞬 脱 窗口 的 盲 
视 现 象 ， 使 得 该 现象 得 到 更 好 的 缓解 和 控制 。 那 么 如 何 最 大 限度 地 利用 视听 整合 功能 
去 降低 甚至 是 消除 注意 瞬 脱 现象 呢 ? 换 而 言 之 ， 视 听 整 合 的 强度 差异 又 是 否 会 对 注 
意 瞬 脱 造成 不 同 程度 的 影响 呢 ? 

Mudrik, Faivre 和 Koch(2014) 指 出 大 部 分 有 意义 的 感觉 整合 现象 是 需要 意识 进 
行 参与 的 ， 也 有 研究 指出 无 意识 下 的 整合 容易 造成 错误 知觉 ， 而 当 倾 注 注意 引起 意 
识 就 会 导致 错觉 现象 消失 (Pamer & Ramsey, 2012)。Mittag 等 人 (2013) 指 出 将 注意 分 配 
于 多 通道 可 以 元 余 效应 增强 ， 以 往 研究 也 发 现在 分 配 性 注意 下 可 以 增强 视听 整合 使 
得 视听 觉 目 标 在 视觉 任务 中 更 容易 被 知觉 (Van der Burg, et al., 2011). 既然 视听 整合 可 
以 减 小 注意 瞬 脱 现象 ， 那 么 是 否 可 以 通过 控制 注意 通道 的 分 配 增 大 这 种 整合 能 力 进 
一 步 减弱 注意 瞬 脱 呢 ?” 偏 向 竞争 模型 (Biased Competition Model) 也 提出 注意 偏向 会 增 
强 对 所 选 定 的 信息 的 感觉 神经 反应 的 理论 假设 (Mishra, Bavelier, & Gazzaley, 2012), 
那么 将 注意 分 配 到 双 通 道 ， 在 理论 上 是 可 以 进一步 提升 整合 对 瞬 脱 的 影响 的 。 因 此 本 
研究 设计 了 第 二 个 实验 ， 通 过 在 听觉 通道 增添 实验 任务 ， 将 被 试 的 注意 分 配 到 视听 
觉 双 通道 中 ， 考 察 该 情况 下 的 增 大 视听 整合 的 强度 是 否 可 以 更 高 效 地 减 小 注意 瞬 脱 
现象 。 

3.1 方法 
(1) 被 试 

根据 样本 量 和 统计 检验 力 采 用 软件 G-Power3.1 计算 得 出 实验 一 所 需 被 试 为 36 
名 ， 本 实验 最 终 招募 的 被 试 为 ** 大 学 的 39 名 在 校本 科 生 或 研究 生 ， 其 年 龄 介 于 
19~28 岁 之 间 ， 所 有 被 试 的 听力 视力 正常 或 者 矫正 后 视力 听力 正常 、 习 人 惯 手 均 为 右 利 
手 、 身 体 状 况 良好 无 脑 损 伤 和 精神 疾病 史 并 且 之 前 均 未 参加 过 类 似 实验 ， 实 验 完成 后 
给 予 被 斌 适量 的 报酬 , 由 于 本 实验 试图 探究 视听 分 散 注意 下 视听 整合 对 注意 瞬 脱 的 影 
响 ， 故 将 其 中 3 名 无 注意 瞬 脱 现象 的 被 试 进行 剔除 后 分 析 。 最 终 参与 数据 分 析 的 有 效 
被 试 人 数 为 36 人 (其 中 男生 12 名 ， 女 生 24 名 )， 平 均 年 龄 为 20.75+2.61 岁 。 

(2) 实验 仪器 和 材料 

实验 仪器 与 实验 1 相同 ， 实 验 材 料 也 沿用 了 实验 1 的 视觉 听觉 刺激 ， 除 了 以 下 
几 点 与 实验 1 有 所 不 同 。 在 实验 2 中 多 添加 了 一 种 声音 ， 该 声音 材料 为 75dB 的 正弦 
波 生成 的 纯音 (300HZ)， 持 续 50ms 与 视觉 刺激 同步 呈现 ， 声 音 通过 放置 在 显示 器 屏 
幕后 中 央 的 外 置 扬 声 器 (PHILIPS SPA311) 播 放 ， 根 据 被 试 口头 报告 ， 能 够 明确 地 判 
世 出 该 声音 是 从 正中 央 的 位 置 发 出 。 将 沿用 实验 1 的 声音 刺激 定义 为 高 音 ， 并 将 新 加 
入 实验 2 的 声音 刺激 定义 为 低音 。 

(3) 实验 设计 和 实验 流程 

本 实验 采用 2( 声 音 条件 : 无 声音 vs. 单 音 T2 同步 )x3( 位 置 滞后 条 件 : Lagl 
vs.Lag2 vs.Lag5) 的 被 试 内 实验 设计 。 在 实验 过 程 中 试 次 总 共 是 6 种 ， 分 别 无 声音 
Lagl、 无 声音 Lag2、 无 声音 Lag5、 单 音 Lagl、 单 音 Lag2 和 单 音 Lag5 ,每 个 条 件 下 有 48 
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个 斌 次， 总 共 288 个 斌 次。 在 实验 的 过 程 当 中 每 个 条 件 完全 随机 呈现 ， 并 且 所 有 的 条 
件 都 进行 了 随机 化 。 

正式 实验 流程 如 图 4 所 示 ， 在 每 一 个 试 次 正式 开始 后 ， 首 先 在 屏幕 正中 央 会 呈 
现 一 个 1000ms 的 十 字 注 视点 ， 要 求 被 试 眼 睛 果 住 该 注视 点 ， 随 后 会 接连 快速 呈现 由 
23 个 元 素 组 成 的 刺激 流 ， 每 个 元 素 的 组 成 包括 四 个 屏 (刺激 呈现 67ms+ 空 白 屏 33ms+ 
掩蔽 刺激 S0ms+ 空 白 屏 100ms)。 每 个 刺激 呈现 后 250ms 会 出 现下 一 个 刺激 ， 整 个 
RSVP 刺激 流 呈 现 之 后 屏幕 中 央 会 呈现 三 个 问题 (Q1: 你 看 到 的 第 一 个 字母 是 什么 ”并 
在 键盘 输入 对 应 按键 ; Q2: 你 看 到 的 第 二 个 字母 是 什么 ”并 在 键盘 输入 对 应 按键 ; ; 
Q3: 判 断 你 听 到 的 声音 ? 高 音 按 1 键 低音 按 0 键 无 声音 按 9 键 )， 要 求 被 试 对 屏幕 呈 
现 的 问题 作出 按键 反应 ， 此 过 程 不 要 求 快速 反应 ， 并 记录 被 试 的 反应 正确 率 。 与 视觉 
刺激 同步 呈现 的 声音 刺激 会 随机 出 现 ， 在 实验 过 程 当中 要 求 被 试 注 意 声音 的 高 低 。 在 
实验 开始 前 ， 被 试 坐 在 电脑 前 调整 下 巴 固 定 器 和 升降 梨 使 目光 与 电脑 屏幕 中 央 持 平 ， 
实验 开始 前 将 打印 好 的 统一 被 试 指导 语 发 放 给 被 试 浏 览 。 进 入 练习 阶段 ， 共 有 24 次 
包含 实验 的 每 一 种 水 平 条 件 (随机 呈现 )。 主 试 在 练习 阶段 中 陪同 被 试 完成 练习 实验 ， 
以 确保 被 试 可 以 清晰 了 解 并 正确 完成 实验 任务 。 整 个 实验 时 长 大 致 约 为 60 分 钟 ( 包 含 
练习 和 休息 时 间 )。 
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4 实验 2 流程 图 
GE: 无 声音 条 件 ， 每 一 个 试 次 单纯 只 呈现 视觉 刺激 不 包含 听觉 刺激 ; 单 声 同步 条 
件 ， 每 一 个 试 次 在 呈现 视觉 刺激 的 基础 上 当 第 二 个 目标 呈现 时 同步 一 个 听觉 刺激 。) 
(4) 数据 分 析 
本 实验 采用 E-primel.1 和 Microsoft Office Excel 专业 增强 版 2016 软件 对 实验 数 
据 进 行 整理 和 分 析 ， 并 将 采用 IBM SPSS Statistics 21 和 JASP 0.11.1.0 软件 对 有 效 数 
据 进 行 统计 学 分 析 和 检验 。 
首先 对 数据 结果 进行 预 处 理 ， 利 用 判断 声音 Q3 的 正确 率 剔 除 未 能 正确 关注 听 
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觉 通道 任务 的 斌 次 。 同 实验 1， 数据 分 析 有 两 个 因 变 量 : TI1 正确 率 ( 判 断 第 一 个 目标 
是 否 正确 的 概率 ) 和 T2M] 正确 率 ( 以 第 一 个 目标 判断 正确 为 前 提 再 判断 第 二 个 目标 是 
否 正确 的 概率 )。 计 算 TI1、T2/T1 正确 率 进 行进 一 步 分 析 。 以 TI1 为 因 变 量 进行 独立 样本 
1 检验 : (声音 条 件 : 无 声音 vs. 单 音 T2 同步 ) 一 一 分 析 不 同 声音 条 件 是 否 显著 。 以 
T2/T1 为 因 变量 进行 2( 声 音 条 件 : 无 声音 vs 单 音 T2 同步 )x3( 位 置 滞后 条 件 : Lagl 
vs.Lag2 vs.Lag5) 两 因素 重复 测量 方差 分 析 一 一 分 析 声 音 条 件 主 效应 和 位 置 条件 主 效 
应 以 及 两 因素 之 间 的 交互 作用 是 否 显著 ， 并 通过 简单 效应 分 析 比 较 不 同 条 件 之 间 的 
差异 显著 性 。 根 据 Martens 和 Wyble(2010) 指 出 的 衡量 AB( 不 同时 间 窗 之 间 正 确 率 差 
异 ) 的 指标 ,对 不 同 声音 条 件 下 产生 的 相应 AB 量 进行 单 因素 方差 分 析 比 较 差异 量 。 

最 后 与 实验 一 采用 相同 的 分 析 方法 后 对 结果 进行 对 比 ， 探 究 视觉 集中 和 视听 分 
散 注 意 下 视听 整合 对 注意 瞬 脱 现象 影响 的 差异 ， 为 防止 数据 稳定 性 造成 影响 在 两 实 
验 采 取 + 检 验 之 后 再 进行 一 步 贝 叶 斯 检验 (Krusche & Liddell, 2017; 胡 传 鹏 等 人 , 2018; 
虽 小 康 , 2012). 


3.2 结果 与 分 析 


首先 根据 Q3 问题 的 反馈 计算 得 出 听觉 判断 任务 正确 率 为 96.36%。 对 Tl 正确 率 
进行 配对 样本 1 检验 (声音 条 件 : 无 声音 vs. 单 音 T2 同步 ) 分 析 。 结 果 发 现 ， 无 声音 条 
件 和 单 音 同步 T2 条 件 之 间 差 异 不 显著 4(35) =0.10, p=0.92, Cohens d=0.02, Atk 
表现 为 无 声音 条 件 下 T1 的 正确 率 (88.75%) 和 单 声 同步 T2 条 件 下 的 正确 率 (88.67%) 在 
统计 学 检验 上 没有 显著 差异 ， 说 明 与 Tl 无关 的 声音 刺激 并 不 会 影响 被 试 对 一 个 任务 
的 判断 准确 率 。 

对 T2/T1 正确 率 进 行 2( 声 音 条 件 : 无 声音 vs. 单 音 T2 同步 )x3( 位 置 沾 后 条 件 : 
Lag] vs.Lag2 vs.Lag5) 两 因素 重复 测量 方差 分 析 ( 如 图 5)。 结果 发 现 ， 声 首 条 件 主 效应 
显著 ，F(1, 35)=12.06，p<0.001，1 二 0.26， 表 明 不 同 声音 条 件 下 会 影响 个 体 对 T2 
识别 判断 的 正确 率 ( 即 注意 瞬 脱 现象 )， 并 通过 进一步 的 成 对 比较 发 现 一 一 单 音 同步 
T2 条 件 下 的 正确 率 (90.179%) 要 显著 高 于 无 声音 条 件 下 的 正确 率 (82.93%)， 说 明 当 与 
T2 同时 呈现 一 个 声音 刺激 (相对 于 没有 声音 ) 时 被 试 对 T2 识别 的 正确 率 提升 ， 注 意 瞬 
脱 现 象 得 到 了 了 缓解。 位 置 条 件 主 效应 显著， F(1.645， 
57.560)=29.37, p<0.001, n,=0.46, RIRH T2 2) T1 不 同 的 滞后 位 置 条 件 会 影响 
个 体 对 T2 判断 的 正确 率 ， 并 通过 进一步 的 成 对 比较 发 现 一 一 Lagl 条 件 的 正确 率 
(78.65%) 显 著 低 于 Lag2 条 件 (88.87%) 和 Lags 条 件 (92.21%)， 说 明 在 本 实验 中 被 试 产 
生 了 经 典 的 注意 有 瞬 脱 现象 一 一 在 RSVP 范式 中 对 T2 判断 的 正确 率 会 随 着 与 Tl 距离 
的 增加 而 提高 。 
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图 5 实验 2 中 不 同 条 件 下 T2/T1 的 正确 率 和 标准 误 
CE: “n.s.” 表 示 p>0.05,“*” 表 示 p<0.05,“**” 表 示 p<0.01) 


声音 和 位 置 交 互 作用 显著 ，F(1.678, 58.745)=11.52，Pp<0.001，m 0.25， 说 明 
T2 呈现 同步 的 声音 和 T2 滞后 Tl 的 位 置 距离 两 因素 会 交互 着 影响 被 试 对 T2 识别 判 
呈 的 正确 率 ， 并 通过 进行 进一步 简单 效应 分 析 结 果 发 现 ， 当 T2 位 置 处 于 Lagl 时 声 
音 的 效应 显著 ，F(1, 35)=15.78 ，p<0.001，n b=0.31， 具 体 表现 为 无 声音 条 件 正 确 率 
(71.36%) 显 著 小 于 单 音 T2 同步 条 件 下 的 正确 率 (85.94%)， 说 明 在 Lagl 条 件 下 当 声 音 
同步 T2 出 现时 会 提升 个 体 对 其 判断 正确 率 ; 当 T2 处 于 Lag2 时 声音 的 效应 显著 ， 
F(1, 35)=7.37，p=0.01， ns。=0.18， 具 体 表现 为 单 音 T2 同步 下 的 正确 率 (92.10%) 要 显 
著 高 于 无 声音 条 件 的 正确 率 (85.94%)， 说 明 同 样 在 Lag2 条 件 下 当 声 音 同步 T2 出 现 
时 也 会 显著 提升 个 体 对 其 判断 正确 率 ; 当 T2 处 于 Lag5 时 声音 的 效应 不 显著 ，F(1， 
35)=0.10，p=0.75，n ,=0.00， 具 体 表现 为 两 种 声音 条 件 下 的 正确 率 差异 不 显著 ， 说 
明 在 Lag5 条 件 下 时 与 T2 是 否 同步 呈现 声音 并 不 会 影响 T2 的 判断 正确 率 。 

同样 如 实验 1， 以 瞬 脱 节点 前 后 时 间 窗 口 Tl1 和 Lag 2b T2/T1 正确 率 差 异 量 (衡量 
AB 大 小 ) 为 因 变 量 ， 不 同 声音 条 件 为 自 变 量 进行 配对 样本 上 检验 (如 图 0)。 结 果 发 现 ， 
在 分 配 性 注意 条 件 下 声音 条 件 的 不 同 会 导致 个 体 注 意 瞬 脱产 生 差 异 ， 
1(1,35)=4.13，p<0.001，Cohen 3 d=0.69, 95%CI=[7.46, 21.86]. 简 而 言 之 ， 说 明了 当 声 
音 同步 T2 出 现时 会 在 瞬 脱 窗口 内 缓解 个 体 的 注意 瞬 脱 现象 。 
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图 6 实验 2 中 不 同 条 件 下 的 正确 率 
CHE: “T0” 表 示 Lag=0， 即 同等 声音 条 件 下 T1 的 正确 率 ) 


对 于 实验 一 和 实验 二 中 不 同 条 件 下 的 处 于 瞬 脱 窗口 的 T2/T1(Lag 1) 和 TI1 正确 率 
分 别 进行 分 析 后 比较 发 现 (如 图 7) 在 实验 一 中 Tl 和 Lagl Xb T2/T1 进行 配对 样本 t 
检验 发 现 ，#(1,35)=2.55， p=0.02, Cohen's d=0.43, 95%CI=[1.20, 10.52]， 说 明 在 单 
音 同步 T2 的 条 件 下 忽略 声音 时 注意 瞬 脱 现象 减 小 但 是 并 没有 消失 。 为 排除 由 于 个 体 
差异 或 数据 不 稳定 等 因素 进行 进一步 贝 叶 斯 检验 分 析 发 现 ，BF10*<3.0， 更 加 严谨 地 
说 明 两 组 数据 是 存在 显著 差异 的 。 而 对 于 实验 二 的 数据 也 采用 同样 的 分 析 方 法 对 T1 
和 Lag] 处 T2/T1 进行 配对 样本 1 检验 发 现 ，4(1,35)=1.643，p=0.11，Cohens d 
=0.27， 说 明 在 单 音 同步 T2 的 条 件 下 选择 注意 声音 时 注意 瞬 脱 消失 。 


4 实验 2: 视 听 分 配 注 意 下 视听 整合 对 注意 瞬 脱 的 影响 视听 整合 对 注意 瞬 脱 的 影响 
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图 7 实验 1 和 实验 2 在 无 声音 和 单 音 同步 条 件 下 的 正确 率 
GE: “T0” 表 示 Lag=0， 即 同等 声音 条 件 下 T1 的 正确 率 ) 
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4 讨论 


本 研究 利用 两 个 实验 考察 了 视听 整合 对 注意 瞬 脱 效应 的 影响 ， 并 通过 控制 被 试 
注意 的 分 配 和 指向 ， 找 到 了 更 显著 有 助 于 缓解 注意 瞬 脱 的 方法 。 在 实验 1 和 实验 2 中 
均 采 用 经 典 的 RSVP 范式 ， 控 制 刺 激流 中 呈现 信息 的 通道 ， 并 要 求 被 试 根据 指导 语 
准确 完成 目标 识别 任务 。 实验 1 的 研究 结果 表明 在 排除 了 声音 凸显 可 能 作为 模糊 整合 
效果 这 一 影响 因素 后 更 严谨 地 指出 视听 整合 可 以 减 小 注意 瞬 脱 现象 ， 主 要 表现 为 当 
需要 判断 的 第 二 个 目标 同步 一 个 声音 刺激 时 ， 原 本 瞬 脱 引起 的 判断 正确 率 降 低 会 显 
著 提 高 ， 并 且 同 时 在 每 一 屏 视 觉 刺 激 都 同步 声音 时 也 会 出 现 同样 的 现象 ,并 且 根 据 注 
意 和 多 感觉 整合 间 存 在 多 种 交互 影响 (Tang, Wu, & Shen, 2016) 和 偏向 竞争 模型 
(Mishra, Bavelier, & Gazzaley, 2012)， 实 验 2 采用 操控 注意 的 集中 或 分 散 状态 ， 在 实 
验 1 的 基础 上 在 听觉 通道 增加 任务 ， 结 果 发 现 当 主动 加 工 听觉 通道 信息 时 视听 整合 
效应 增强 可 以 更 明显 地 减 小 注意 瞬 脱 现象 ， 并 且 对 前 后 两 个 目标 判断 的 正确 率 之 间 
已 经 没有 统计 学 上 的 显著 差异 ， 即 当 将 注意 分 配 到 视听 两 通道 时 视听 整合 调节 效应 
增加 可 以 更 显著 地 减 小 这 种 在 连续 注意 中 的 局 限 性 现象 。 

通过 实验 1 的 数据 分 析 结 果 ， 我 们 首先 发 现 了 在 无 声音 条 件 下 出 现 了 传统 的 视 
觉 注意 瞬 脱 现象 ， 即 当 T2 呈现 的 位 置 处 于 Tl 之 后 250ms 的 时 间 窗 口内 时 ， 被 试 对 
F T2 的 识别 判断 正确 率 出 现 显 著 降 低 ， 这 与 先前 大 量 的 有 关 视 觉 注 意 瞬 脱 领 域 的 实 
验 结 果 相 似 (Chen & Wang, 2012; Dux & Marois, 2009; Stein, Peelen, Funk & Seidl, 2010 
)。 在 单 音 同步 T2 的 条 件 下 也 观测 到 了 与 类 似 先前 研究 设 定 的 实验 现象 ， 即 在 原本 会 
发 生 瞬 脱 的 时 间 窗 口内 ， 当 T2 呈现 时 同步 一 个 声音 刺激 可 以 使 对 其 的 正确 率 识别 上 
升 (Kranczioch & Thorne, 2015; Olivers & Van der Burg, 2008; Yasuhiro, Jiro, & Katsumi, 
2014)。 由 于 刺激 通道 属性 的 新 异性 也 可 能 会 引起 注意 捕获 (Robinson, Mattingley, & 
Judith , 2013)， 故 本 研究 在 前 人 基础 之 上 设计 了 全 程 伴随 声音 的 条 件 ， 结 果 发 现 全 程 
伴随 声音 条 件 和 单 音 同步 T2 条 件 下 个 体 在 原本 瞬 脱 窗口 内 对 视听 目标 识别 的 准确 率 
都 显著 高 于 无 声音 条 件 ， 并 且 两 者 没有 显著 差异 。 由 此 可 以 说 明 无 论 声音 刺激 是 否 凸 
显 ， 当 它 与 视觉 刺激 同步 时 都 会 提升 视觉 目标 的 识别 效率 ， 即 更 充分 地 表明 了 视听 
整合 的 确 会 影响 注意 瞬 脱 现象 ,也 更 加 充分 地 验证 了 视听 整合 可 以 增强 感觉 刺激 的 显 
著 性 (Stein et al., 1996)， 引 起 了 自 下 而 上 的 刺激 驱动 加 工 (Matusz, & Eimer, 2011)， 在 
注意 资源 相对 不 充足 的 条 件 下 也 可 以 捕获 注意 ， 从 而 缓解 注意 瞬 脱 带 来 的 识别 目标 
效率 降低 现象 。 值 得 注意 的 是 ， 在 本 实验 中 Lagi 与 Lag5 两 个 位 置 条 件 下 在 无 声音 
和 全 程 伴随 两 种 声音 模式 出 现 相 反 的 正确 率 变化 。 这 可 能 是 由 于 任务 的 设置 导致 的 ， 
相 比 于 无 声音 条 件 对 于 全 程 伴随 条 件 而 言 ， 在 Lag] 处 由 于 视听 整合 效应 的 产生 导致 
其 正确 率 升 高 与 先前 研究 和 理论 解释 一 致 (Olivers & Van der Burg, 2008; Yasuhiro, 
Jiro, & Katsumi, 2014); 而 在 Lags 位 置 上 表现 出 的 反 转 ， 则 可 能 两 目标 之 间 随 着 位 
置 增加 中 间 呈 现 的 分 心 物 干扰 效应 增加 ( 张 明 , 王 凌 云 , 2009)， 导 致 被 试 对 IT2 之 前 同 
样 形成 了 整合 的 元 素 也 加 剧 了 注意 投入 导致 对 后 续 目 标识 别 能 力 降 低 。 同 样 在 实验 2 
中 ， 经 过 数据 统计 分 析 后 也 发 现 了 在 无 声音 条 件 下 出 现 了 传统 的 注意 瞬 脱 现象 。 并且 
在 视听 分 散 注 意 控制 下 单 音 同步 T2 的 条 件 中 也 出 现 了 被 试 对 瞬 脱 窗口 的 T2 视听 目 
标识 别 正确 率 上 升 的 现象 ,并 且 对 于 前 后 两 个 目标 的 识别 正确 率 进 行 不 存在 统计 学 上 
的 显著 差异 ， 说 明 当 注意 分 散在 视听 通道 时 视听 整合 对 注意 瞬 脱 调节 的 作用 也 随 之 
增强 。 同 样 先前 许多 研究 也 表明 视听 整合 与 注意 两 者 之 间 存 在 着 相互 作用 (Talsma， 
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Senkowski, Soto-Faraco, & Woldorff, 2010)， 实 验 2 结果 同样 支持 了 并 丰富 了 两 者 错 
综 复 杂 的 交互 加 工 机 制 ， 也 同样 证 实 了 整合 不 仅仅 会 影响 选择 性 注意 而 且 在 分 配 性 
注意 研究 也 同样 适用 。 在 RSVP 范式 中 快速 大 量 呈 现 的 刺激 导致 了 刺激 与 刺激 之 间 形 
成 了 较 高 的 竞争 水 平 ， 而 当 这 种 竞争 关系 较 强 时 注意 就 会 影响 视听 整合 (Van Ee, Van 
Boxtel, Parker, & Alais, 2009)。 而 以 往 关 于 视听 双 通 道 注意 的 研究 结论 ， 当 同时 具有 
视觉 和 听觉 属性 的 目标 出 现时 会 形成 视听 整合 进而 增 大 判断 目标 的 感知 觉 显 著 性 ， 
使 视觉 判断 任务 中 的 该 目标 变 得 更 加 突出 (Van der Burg et al., 2011)。 所 以 当 注 意 被 分 
配 到 双 通 道 时 视听 目标 引起 的 整合 增 大 ， 在 实验 中 表现 出 瞬 脱 显著 减 小 以 至 于 消失 。 
不 仅 如 此 ， 从 注意 瞬 脱 相关 理论 的 角度 论述 本 实验 的 结果 也 验证 了 在 注意 处 于 分 散 
状态 下 个 体 在 瞬 脱 窗口 任务 识别 正确 率 未 降 反 升 的 现象 (Dale & Arnell, 2010)。 实验 的 
结果 对 注意 瞬 脱 的 理论 解释 同样 有 着 寓意 作用 ,虽然 注意 瞬 脱 属于 一 种 易 变 的 注意 现 
象 (Miisch et al., 2012)， 但 是 对 于 它 的 产生 都 可 以 从 资源 分 配 还 是 资源 有 限 的 角度 来 
进行 解析 (Luo & Zhao, 2014)。 资 源 耗 竭 理论 则 认为 当 对 Tl 在 加 工时 占用 过 多 的 注意 
中 枢 资 源 ， 导 致 没有 剩余 资源 对 后 续 一 定 窗 口内 的 T2 进行 加 工 进 而 导致 注 意 盲 ， 诸 
如 此 类 的 资源 有 限 理论 都 表现 出 了 资源 在 T1 和 T2 之 间 的 权衡 ( 张 明 , ERS, 
2009; ). 而 在 本 研究 中 与 Tl 相对 比 而 言 ， 视 听 T2 引起 了 视听 整合 可 能 会 导致 个 体 对 
其 的 知觉 闪 限 降低 ， 使 得 T2 即使 在 认 知 资源 配置 不 足 的 情况 下 仍然 可 以 加 工 。 同 样 
也 可 以 从 资源 竞争 分 配 的 角度 理解 (Shapiro, Schmitz, et al., 2006)， 即 T2 的 强度 增加 
占据 了 更 多 资源 导致 加 工 能 力也 提升 了 ， 在 本 实验 中 就 表现 为 T2 具备 双 通 道 属性 能 
够 在 资源 中 枢 进行 整合 加 工 占据 了 更 多 的 资源 进而 得 到 了 进一步 的 加 工 。 但 本 研究 与 
以 往 研 究 存 在 某 些 差异 ， 实 验 数据 显示 只 在 Lagl 处 发 现 了 瞬 脱 现象 ， 这 可 能 是 由 于 
实验 材料 的 跨 文 化 敏感 差异 所 导致 的 ， 即 以 往 研究 的 参与 者 从 小 熟知 英文 字母 ， 而 
本 研究 中 的 被 试 由 于 母语 环境 的 不 同 ， 在 对 单个 刺激 的 认 知 加 工 投射 更 多 的 注意 。 根 
据 过 度 投入 假设 理论 (Olivers & Nieuwenhuis, 2006) 认 为 投入 的 资源 超出 资源 闷 限 ， 
引起 对 后 续 较 长 时 间 窗 中 的 干扰 的 加 工 意识 也 没有 达到 六 限 (Arend, Johnston, & 
Shapiro, 2006)， 导 致 注意 瞬 脱 窗口 缩小 。 也 存在 另外 一 种 可 能 性 ， 即 考虑 到 视觉 注意 
瞬 脱 的 个 体 差异 性 ( 陈 江涛 等 人 , 2014) 本 实验 在 选取 更 多 被 试 的 同时 也 设置 了 明显 高 
于 前 人 研究 的 试 次 个 数 ，Fecteau 和 Munoz(2003) 指 出 实验 中 个 体 的 行为 表现 会 受到 
近期 事件 和 任务 的 影响 ， 这 就 容易 导致 被 试 由 于 试 次 的 增加 逐渐 适应 于 当前 任务 进 
而 导致 注意 瞬 脱 持续 时 间 变 短 。 

将 前 后 两 个 实验 分 别 进行 分 析 后 对 比 发 现 ， 在 瞬 脱 最 明显 的 地 方 (T2 处 于 Lagl 
处 )， 对 比 同步 T2 的 声音 减 小 注意 瞬 脱 差异 的 能 力 发 现 ， 相对 于 个 体 处 于 视觉 集中 
注意 条 件 下 (忽略 听觉 通道 的 声音 只 注意 视觉 通道 的 字母 ) 当 处 于 分 视听 分 散 注 意 条 
件 下 (主动 注意 视觉 通道 的 字母 以 及 听觉 通道 的 声音 ) 由 声音 同步 目标 引起 的 视听 整 
合 效应 增强 以 至 于 注意 瞬 脱 消失 。 两 者 之 间 的 结果 差异 支持 了 偏向 竞争 模型 假说 
(Mishra, Bavelier, & Gazzaley, 2012)， 即 将 注意 转 到 双 通 道 时 个 体 对 两 通道 的 感觉 ， 
会 增强 对 所 选 定 通道 信息 的 感觉 神经 反应 (Beck & Kastner, 2009)， 引 起 视听 整合 效应 
增加 。 进 而 使 得 在 瞬 脱 窗口 内 的 前 后 两 个 目标 识别 准确 性 持平 导致 注意 瞬 脱 消失 。 不 
仅 如 此 ， 当 注意 双 通 道 时 整合 能 力 表 现 更 强 也 有 效 验 证 了 有 限 资 源 多 通道 共享 机 制 ， 
即 视觉 系统 资源 不 足 时 可 将 多 通道 共享 的 感知 注意 资源 释放 到 听觉 系统 并 进行 整合 
加 工 (Haroush, Deouell, & Hochstein, 2011)。 虽 然 二 者 在 目标 判断 正确 率 的 趋势 变化 
中 都 表现 出 相似 的 趋势 (如 图 10 所 示 )， 但 是 具体 某 些 点 的 数据 仍 有 差异 ， 有 具体 表现 


为 较 于 实验 2 而 言 实 验 1 在 Lag 较 大 的 条 件 下 出 现 正确 率 上 升 。 造 成 这 种 差异 的 原因 
可 能 是 由 于 实验 条 件 呈 现 的 随机 化 导致 的 ， 由 于 实验 1 要 排除 声音 凸显 这 一 干扰 因 
素 故 将 其 呈现 方式 调整 为 Block 设计 ,而 实验 2 则 沿用 较为 普遍 的 完全 随机 化 呈现 。 根 
据 先前 也 有 提 到 试 次 的 历史 影响 效应 (Maljkoyic, Nakayama, 1994)， 实 验 1 的 被 试 更 
加 熟悉 了 任务 当前 区 组 刺激 呈现 规律 引起 正确 率 上 升 ， 所 以 导 了 致 两 个 实验 间 的 微 
小 差距 。 

在 本 研究 中 总 结 发 现 了 视听 整合 可 以 弱化 注意 瞬 脱 现象 并 且 可 以 通过 控制 注意 
通道 来 影响 整合 效应 进一步 对 注意 瞬 脱 现象 进行 不 同 程度 的 调节 ， 这 一 发 现 为 后 续 
探究 如 何 调节 注意 在 时 间 维 度 持续 加 工 表 现 出 来 的 局 限 性 奠定 了 基础 。 综 上 所 述 研究 
不 仅 在 前 人 研究 基础 之 上 证 实 了 视听 整合 可 以 减 小 注意 瞬 脱 这 一 结论 并 且 进 一 步 探 
究 了 注意 分 配 调控 下 二 者 的 交互 作用 。 本 研究 为 后 续 的 细致 化 探究 葛 定 了 坚实 的 理论 
成 果 ， 也 为 探索 注意 、 认 知 乃 至 于 脑 网 络 提 供 了 不 可 或 缺 的 理论 支撑 。 然 而 任何 研究 
的 最 终 目的 都 是 将 理论 基础 作为 支撑 幻化 到 现实 生活 的 应 用 中 去 ， 基 于 本 研究 的 分 
析 结 果 ， 视 听 整 合影 响 注 意 瞬 脱 的 客观 规律 对 于 许多 领域 都 有 良好 的 借鉴 作用 。 在 人 
口 老龄 化 逐渐 上 升 的 21 世纪 ， 可 以 通过 研究 结果 的 规律 进行 模拟 训练 来 提升 并 预防 
老年 人 知觉 功能 退化 ， 提 升 老 年 人 生活 幸福 指数 。 也 可 将 其 规律 应 用 到 交通 心理 学 中 ， 
例如 驾驶 安全 、 车 内 指示 灯 工 效 学 设计 以 及 指挥 信号 灯 的 设计 以 最 大 限度 地 提升 驾驶 
安全 性 ,不 仅 如 此 ， 如 今 随 着 国家 教育 局 不 断 推进 教育 信息 化 体制 改革 ， 多 媒体 教学 
被 大 量 引 进 到 了 教学 课堂 ， 根 据 学 生 注 意 力 持久 度 的 发 展 规律 和 整合 效应 的 促进 作 
用 将 其 综合 应 用 到 教学 软件 系统 中 同样 可 以 提升 教师 教学 水 平和 学 生 学 习 效率 。 另 一 
方面 ， 在 实验 中 发 现 的 客观 规律 和 缓解 措施 也 可 以 协助 运动 员 的 选拔 等 工作 并 为 患 
有 注意 缺陷 障碍 等 等 特殊 人 和 群 的 知觉 控制 训练 设置 提供 科学 依据 。 本 研究 也 存在 一 些 
不 足 之 处 ， 视 觉 层 面 的 注意 瞬 脱 现象 是 视觉 选择 性 注意 在 时 程 中 一 种 常见 的 抑制 现 
象 ， 其 背后 的 机 制 有 别 于 以 往 经 验 研究 的 空间 维度 ， 然 而 关于 持续 性 注意 中 的 视听 
整合 是 发 生 的 阶段 还 尚 有 待 商 榨 ， 在 未 来 可 以 采用 事件 相关 电位 技术 对 这 种 现象 的 
发 生 时 间 进 行 细致 化 探索 。 
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6 结论 视听 整合 对 注意 瞬 脱 的 影响 
5 结论 

(1) 视听 整合 可 以 调节 注意 瞬 脱 现象 。 

(2) ”视听 整合 在 视觉 单 通道 集中 注意 下 可 以 减 小 注意 瞬 脱 现象 。 

G) ”视听 整合 在 双 通 道 分 散 注 意 下 整合 能 力 增强 ， 可 以 更 明显 地 减 小 注意 瞬 
脱 现 象 。 
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Abstract: Attentional Blink (AB) refers to the phenomenon that an individual’ s 
ability is diminished to recognize stimuli in a short period of time. The 
phenomenon is easy to cause the loss of individuals to the subsequent information 
processing, which is the embodiment of the limitation of attention in the time 
dimension. Many studies have shown that, when individuals communicate with complex 
information environments, they can recognize objects and stimuli that can present 
information in visual and auditory channels more quickly and accurately. This 
natural phenomenon is called Audiovisual Integration (AVI). Previous researches 
indicate that audiovisual integration can improve spatial attention orientation and 
search efficiency. Some studies have suggested that sensory facilitation can also 
occur during long-term attention. The present study is to explore whether 
attentional blink can be regulated by audiovisual integration. If there is an 
impact between the two, then how the intensity of integration will affect the 
attentional blink? And how the effectiveness of this regulation is more optimized 
In experiment 1, “RSVP” paradigm was used to compare the transient effects under 
different sound conditions, the results showed that the recognition accuracy was 
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significantly improved when the ignored sound appeared synchronously with the 
target. That proved that audio-visual integration can slow down attention 
transient. Furthermore, this effect was not caused by auditory salience. In 
experiment 2, according to the biased competition model, attentional blink could be 
eliminated significantly by adding auditory tasks and assigning attention to the 
audio-visual integration enhancement in dual channels. At the same time, it shows 
that audio-visual integration can adjust the phenomenon of attentional blink in 
different degrees. 


Key words: attentional blink; multisensory integration; audiovisual integration; 
bimodal divided attention; modality-specific attention 


202006.00037v1 


chinaXiv 


视听 整合 对 注意 瞬 脱 的 影响 


参考 文献 


(通讯 作者 : 张 HA, E-mail: psyzm@suda. edu. cn; JHA, E-mail: tangyu-2006@163. com) 


作者 页 献 声明 : 


ERA: 
赵 超越 : 
唐 晓 雨 : 
IK H: 


实验 设计 、 
数据 收集 、 
实验 设计 、 
实验 设计 、 


数据 解释 、 论 文 写作 ; 
分 析 ; 论文 写作 
论文 修改 

论文 修改 


